狂跑一万帧丝滑不崩!拿着几十块单摄走一圈,整栋楼3D地图建好了
狂跑一万帧丝滑不崩!拿着几十块单摄走一圈,整栋楼3D地图建好了SLAM教父罕见公开点赞!中国队开源的LingBot-Map,仅靠普通摄像头实现万帧流式3D重建,在全网引爆120万人围观。
SLAM教父罕见公开点赞!中国队开源的LingBot-Map,仅靠普通摄像头实现万帧流式3D重建,在全网引爆120万人围观。
如果把今天最热门的几个方向摆在一起看,你会发现它们其实在卡同一道坎。
本文主要介绍来自该团队的最新论文:Scalable Object Relation Encoding for Better 3D Spatial Reasoning in Large Language Models。
蚂蚁灵波,下了盘大棋。
前两天我刷到一个工具的时候,第一反应其实不是拿真人照片试,也不是拿潮玩图试。
当你和 3D 数字人对话时,有没有遇到过这种诡异时刻:它的嘴在动,但表情依旧僵硬;手在挥舞,但和说话内容完全脱节;更糟的是,那种外表像真人但动作不自然的违和感,让人瞬间陷入 “恐怖谷”。
VLM看图像描述头头是道,一遇到3D空间推理就“晕菜”。
要论整活儿,还得是何同学。
当你希望 AI 将 "士兵举起手臂,向后倾身,然后身体向前扑倒" 这段文字转化为一段 3D 角色动画,现有大多数方法给出的答案是:一段摇摇晃晃、语义残缺的短片段。这并非模型能力不足,问题的根源在于将运动表达为逐帧离散序列这一根本性的设计决策。
在GitHub上上线没几天就冲到5.4k stars的3D建筑编辑器开源项目——Pascal Editor。设计软件咱见的不少,但跑在浏览器里的还是有点新鲜,我帮大家浅浅总结了一下Pascal Editor的一些核心亮点: